@echo off
echo 开始训练德州扑克AI (使用A800 GPU加速)...

:: 检查CUDA环境
nvidia-smi >nul 2>&1
if errorlevel 1 (
    echo 错误：未检测到NVIDIA GPU或CUDA环境未正确配置
    echo 请确保已安装NVIDIA驱动和CUDA
    pause
    exit /b
)

:: 检查Python环境
python --version >nul 2>&1
if errorlevel 1 (
    echo 错误：未找到Python环境
    pause
    exit /b
)

:: 设置CUDA环境变量
set CUDA_VISIBLE_DEVICES=0
set PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512

:: 安装依赖
echo 安装依赖...
pip install -r requirements.txt
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

:: 显示GPU信息
echo.
echo GPU信息:
nvidia-smi
echo.

:: 开始训练
echo 开始第一阶段训练 - 基础策略学习 (200万局)...
python training/self_play.py --num_episodes 2000000 --save_interval 10000

echo 开始第二阶段训练 - 深度策略优化 (500万局)...
python training/self_play.py --num_episodes 5000000 --save_interval 20000

echo 开始第三阶段训练 - 对抗训练 (800万局)...
python training/self_play.py --num_episodes 8000000 --save_interval 50000

echo 开始第四阶段训练 - 极限优化 (500万局)...
python training/self_play.py --num_episodes 5000000 --save_interval 50000

:: 评估训练效果
echo 开始最终评估 (5万局)...
python training/evaluate.py --num_training_games 50000 --eval_interval 1000 --num_eval_games 1000

echo 训练完成！
echo 评估结果已保存到 evaluation_results.png 和 evaluation_decision_tree.png

pause 